Этот вводный модуль устраняет разрыв между сырыми, неструктурированными массивами символов и математической строгостью теории формальных языков. Мы переходим от императивного поиска—ручной проверки каждого символа — к декларативному описанию, где мы определяем формальную грамматику, представляющую бесконечное множество допустимых строк.
1. Природа энтропии строки
Сырые данные неизбежно «неупорядочены», потому что не имеют структуры; это просто последовательность байтов, пока формальная грамматика не классифицирует их компоненты. В проектировании протоколов проверка этой энтропии является первой линией обороны против некорректных входных данных.
2. Парадигмы и автоматы
Регулярные выражения основаны на иерархии Хомского. Регулярные выражения служат чертежами для создания детерминированных конечных автоматов (ДКА). Вместо написания if-else цепочек для поиска шаблонов мы определяем, что такое сам шаблон есть, позволяя движку обрабатывать логику обхода.